package com.edu.udistrital.indexing.document;

import java.io.File;

import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.TermVector;

import com.edu.udistrital.pdf.PdfToText;

public class ClassificationDocument implements DocumentIndex{

	@Override
	public Document obtenerDocumento(File file) throws Exception {
		Document doc = new Document();

		String categoria = "?";
				
		String contenido = PdfToText.obtenerTextoPdf(file);
		
		doc.add(new Field("contenido", contenido, Field.Store.YES, Field.Index.ANALYZED, TermVector.YES));
		doc.add(new Field("archivo", file.getCanonicalPath(),	Field.Store.YES, Field.Index.NOT_ANALYZED_NO_NORMS));
		doc.add(new Field("categoria", categoria, Field.Store.YES, Field.Index.NOT_ANALYZED));
		
		return doc;
	}


}
